Recherche de passages pertinents dans les fichiers logs par enrichissement de requêtes

نویسندگان

  • Hassan Saneifar
  • Stéphane Bonniol
  • Anne Laurent
  • Pascal Poncelet
  • Mathieu Roche
چکیده

The question answering systems are considered the next generation of search engines. This paper focuses on the first step of this process which is to search for relevant passages containing the responses. Such a task can be difficult because of the complexity of data, logs files in our case. Our contribution is based on enrichment of queries using a learning method based on the notion of "lexical world" and a novel term weighting function. This original weighting function, implemented within the enrichment process, aims to assign a high weight to terms that might be relative to the context of the answer. Experiments conducted on real data show that our protocol of primitive query enrichment allows to extract relevant passages. MOTS-CLÉS : Recherche d’Information, Système question réponse, Recherche de passage, enrichissement de requête, apprentissage de contexte

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Recherche d'information. Analyse des résultats de différents systèmes réalisant la même tâche

RESUME: Les systèmes de recherché d’information visent à optimiser les résultats qu’ils fournissent en réponse à une requête de l’utilisateur. Les performances de ces systèmes sont généralement mesurées par rapport à des collections de test communes, comme les collections de TREC (Text REtrieval Conférence). Cette évaluation est réalisée de façon globale, en calculant une moyenne des résultats ...

متن کامل

Un outil de détection automatique de thèmes

Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...

متن کامل

Recherche d'information médicale pour le patient: Impact de ressources terminologiques

RÉSUMÉ. Le droit d’accès au dossier clinique par les patients est inscrit dans le code de Santé Publique. Cependant, ce contenu reste difficile à comprendre. Nous proposons une expérience, où les requêtes des patients sont utilisées pour retrouver les documents pertinents. Nous utilisons le moteur de recherche Indri, basé sur le modèle statistique de la langue, et des ressources sémantiques. L’...

متن کامل

Fusion de systèmes pour la recherche de passages dans des textes

RÉSUMÉ Les systèmes de recherche d’information (RI) présentent une grande variabilité dans la liste des documents qu’ils retrouvent en réponse à une même requête. Dans cet article nous étudions l’apport de la fusion des résultats des systèmes pour la RI. Ainsi, nous utilisons les résultats obtenus sur un ensemble de 50 requêtes par différents systèmes qui ont participé à la tâche TREC de sélect...

متن کامل

Une nouvelle approche pour la recherche d'images par le contenu

Résumé. On utilise l’analyse factorielle des correspondances (AFC) pour la recherche d’images par le contenu en s’inspirant directement de son utilisation en analyse des données textuelles (ADT). L’AFC permet ici de réduire les dimensions du problème et de sélectionner des indicateurs pertinents pour la recherche par le contenu. En ADT, l’AFC est appliquée à un tableau de contingence croisant m...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010